{"id":9359,"date":"2023-05-27T12:34:04","date_gmt":"2023-05-27T10:34:04","guid":{"rendered":"https:\/\/cmc.deusto.eus\/enzuazua\/?p=9359"},"modified":"2023-05-27T12:34:04","modified_gmt":"2023-05-27T10:34:04","slug":"control-y-aprendizaje-automatico-2","status":"publish","type":"post","link":"https:\/\/cmc.deusto.eus\/enzuazua\/control-y-aprendizaje-automatico-2\/","title":{"rendered":"Control y aprendizaje autom\u00e1tico"},"content":{"rendered":"<p>&nbsp;<\/p>\n<p><strong>Hay dos aspectos sorprendentes del origen, historia y estado actual de las matem\u00e1ticas que son objeto de debate recurrente. El primero es la incre\u00edble capacidad de las matem\u00e1ticas para describir procesos naturales, industriales y tecnol\u00f3gicos, mientras que el segundo se refiere a la unidad e interconexi\u00f3n de todas las disciplinas matem\u00e1ticas.<\/strong><\/p>\n<p>Como ejemplo de estas dos caracter\u00edsticas intr\u00ednsecas de las matem\u00e1ticas, en este art\u00edculo describiremos algunas de las pasarelas que unen dos de sus ramas: la teor\u00eda de control y el aprendizaje autom\u00e1tico (AA). Como vamos a ver, estas \u00e1reas, ambas de gran impacto tecnol\u00f3gico, constituyen valles vecinos en el complejo paisaje del universo matem\u00e1tico. En particular, la teor\u00eda del control forma parte indiscutible y relevante de los cimientos del AA.<\/p>\n<p><a href=\"https:\/\/es.wikipedia.org\/wiki\/Arist%C3%B3teles\" target=\"_blank\" rel=\"noopener\">Arist\u00f3teles<\/a> se anticip\u00f3 cuando apunt\u00f3 a la necesidad de que los procesos se automatizaran para liberar a los seres humanos de sus tareas m\u00e1s pesadas, [3]. Dos milenios m\u00e1s tarde, en la d\u00e9cada de 1940, el matem\u00e1tico y fil\u00f3sofo <a href=\"https:\/\/es.wikipedia.org\/wiki\/Norbert_Wiener\" target=\"_blank\" rel=\"noopener\">Norbert Wiener<\/a> redefini\u00f3 el t\u00e9rmino &#8220;cibern\u00e9tica&#8221; -que anteriormente hab\u00eda acu\u00f1ado <a href=\"https:\/\/es.wikipedia.org\/wiki\/Andr%C3%A9-Marie_Amp%C3%A8re\" target=\"_blank\" rel=\"noopener\">Andr\u00e9-Marie Amp\u00e8re<\/a>&#8211; como &#8220;la ciencia de la comunicaci\u00f3n y el control en animales y m\u00e1quinas&#8221;.<\/p>\n<p>La definici\u00f3n de Wiener refleja la contribuci\u00f3n definitiva realizada por la disciplina del control \/ cibern\u00e9tica a la revoluci\u00f3n industrial e involucra dos binomios conceptuales esenciales. El primero es el de \u201ccontrol-comunicaci\u00f3n\u201d, subrayando la necesidad de informaci\u00f3n suficiente y de calidad sobre el estado de un sistema para tomar las decisiones correctas, alcanzar un objetivo determinado o evitar que el sistema entre en reg\u00edmenes de riesgo. El segundo binomio es el de \u201canimal-m\u00e1quina\u201d que refleja el empe\u00f1o humano, predicho por Arist\u00f3teles, de construir m\u00e1quinas que realicen tareas que, de otro modo, les impedir\u00edan dedicar tiempo y energ\u00eda a otras m\u00e1s satisfactorias.<\/p>\n<p>Por otra parte, el desarrollo de m\u00e1quinas que \u201caprendan\u201d es el objetivo principal del aprendizaje autom\u00e1tico. El estrecho v\u00ednculo entre el control y\/o la cibern\u00e9tica y la AA se establece por tanto en la propia definici\u00f3n de Wiener.<\/p>\n<p>Las distintas disciplinas matem\u00e1ticas est\u00e1n divididas por cordilleras conceptuales y t\u00e9cnicas y a menudo han evolucionado en comunidades diferentes. Como tales, a menudo las interconexiones son dif\u00edciles de observar. Construir los caminos de conexi\u00f3n e identificar los hipot\u00e9ticos pasos de monta\u00f1a requiere un importante nivel de abstracci\u00f3n. Demos por tanto un paso atr\u00e1s y adoptemos una perspectiva m\u00e1s amplia para analizar con m\u00e1s detalle los v\u00ednculos existentes entre el control y el AA.<\/p>\n<p>La noci\u00f3n de controlabilidad nos ayuda a desvelar una de las pasarelas entre estas dos disciplinas. El problema de la controlabilidad consiste en conducir un sistema din\u00e1mico desde una configuraci\u00f3n inicial a otra final en un horizonte temporal determinado mediante controles viables y h\u00e1bilmente dise\u00f1ados. En el marco de los sistemas lineales de dimensi\u00f3n finita<\/p>\n<p><img decoding=\"async\" class=\"alignnone size-full wp-image-9360 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_1.png\" alt=\"\" width=\"366\" height=\"80\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_1.png 366w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_1-300x66.png 300w\" data-sizes=\"(max-width: 366px) 100vw, 366px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 366px; --smush-placeholder-aspect-ratio: 366\/80;\" \/><\/p>\n<p>la respuesta es elemental y cl\u00e1sica (se remonta al trabajo de <a href=\"https:\/\/es.wikipedia.org\/wiki\/Rudolf_E._Kalman\" target=\"_blank\" rel=\"noopener\">Rudolf Kalman<\/a> en la d\u00e9cada de 1950, al menos), [6]. El sistema es controlable si y s\u00f3lo si la matriz que gobierna la din\u00e1mica del sistema y la que describe los efectos de los controles sobre los distintos componentes del estado verifican la c\u00e9lebre condici\u00f3n de rango<\/p>\n<p><img decoding=\"async\" class=\"alignnone size-full wp-image-9361 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_2.png\" alt=\"\" width=\"666\" height=\"84\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_2.png 666w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_2-300x38.png 300w\" data-sizes=\"(max-width: 666px) 100vw, 666px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 666px; --smush-placeholder-aspect-ratio: 666\/84;\" \/><\/p>\n<p>El tama\u00f1o del control depende naturalmente de la longitud del horizonte temporal; m\u00e1s grande horizontes temporales cortos y de menor \u00a0amplitud para horizontes m\u00e1s largos.<\/p>\n<div id=\"attachment_9365\" style=\"width: 340px\" class=\"wp-caption alignleft\"><img decoding=\"async\" aria-describedby=\"caption-attachment-9365\" class=\"wp-image-9365 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_1.png\" alt=\"Figura 1. Control simult\u00e1neo de trayectorias de una ecuaci\u00f3n diferencial ordinaria neuronal (NODE) para la clasificaci\u00f3nseg\u00fan dos etiquetas diferentes (azul\/rojo), exhibiendo la naturaleza de giro de las trayectorias. Figura cortes\u00eda de [5]. \" width=\"330\" height=\"283\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_1.png 508w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_1-300x257.png 300w\" data-sizes=\"(max-width: 330px) 100vw, 330px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 330px; --smush-placeholder-aspect-ratio: 330\/283;\" \/><p id=\"caption-attachment-9365\" class=\"wp-caption-text\">Figura 1. Control simult\u00e1neo de trayectorias de una ecuaci\u00f3n diferencial ordinaria neuronal (NODE) para la clasificaci\u00f3n<br \/>seg\u00fan dos etiquetas diferentes (azul\/rojo), exhibiendo la naturaleza de giro de las trayectorias. Figura cortes\u00eda de [5].<\/p><\/div>De hecho, tal y como anticip\u00f3<a href=\"https:\/\/www.ugr.es\/~eaznar\/von_neumann.htm\" target=\"_blank\" rel=\"noopener\"> John von Neumann<\/a> y analiz\u00f3 el Premio Nobel de Econom\u00eda <a href=\"https:\/\/www.nobelprize.org\/prizes\/economic-sciences\/1970\/samuelson\/facts\/\" target=\"_blank\" rel=\"noopener\">Paul Samuelson<\/a>, la propiedad &#8220;turnpike&#8221; se manifiesta en horizontes temporales largos; los controles tienden a pasar la mayor parte del tiempo en la configuraci\u00f3n \u00f3ptima de estado estacionario [5]. Aplicamos este principio poco conocido de forma sistem\u00e1tica (y a menudo inconsciente) en nuestra vida cotidiana. Por ejemplo, cuando vamos al trabajo, nos apresuramos a tomar nuestra bicicleta o transporte p\u00fablico -nuestra autopista en este viaje- y esperamos a llegar a nuestro destino. Las terapias m\u00e9dicas para enfermedades cr\u00f3nicas tambi\u00e9n utilizan este principio; los m\u00e9dicos pueden indicar a los pacientes, por ejemplo, que tomen una pastilla al d\u00eda regularmente despu\u00e9s del desayuno, en lugar de proponer una medicaci\u00f3n variable cada d\u00eda, que tal vez podr\u00eda ser algo m\u00e1s eficaz, pero sin duda mucho m\u00e1s dif\u00edcil de seguir. Esta propiedad surge incluso en el campo de la econom\u00eda, cuando los bancos nacionales fijan los tipos de inter\u00e9s en horizontes de seis meses y s\u00f3lo revisan para ajustarlos peri\u00f3dicamente a los nuevos escenarios macroecon\u00f3micos que van surgiendo.<\/p>\n<p>\u00bfSon estas ideas y m\u00e9todos relevantes para el AA? Empecemos analizando el resultado seminal de <a href=\"https:\/\/ieeexplore.ieee.org\/author\/37328555200\" target=\"_blank\" rel=\"noopener\">George Cybenko<\/a>: el llamado teorema de aproximaci\u00f3n universal (TAU). El TAU afirma que una combinaci\u00f3n finita de funciones de activaci\u00f3n reescaladas y desplazadas (es decir, redes neuronales) de la forma\u00a0<img decoding=\"async\" class=\"alignnone size-full wp-image-9362 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_3.png\" alt=\"\" width=\"640\" height=\"166\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_3.png 640w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_3-300x78.png 300w\" data-sizes=\"(max-width: 640px) 100vw, 640px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 640px; --smush-placeholder-aspect-ratio: 640\/166;\" \/><\/p>\n<p>son densas en una variedad de espacios funcionales [1]. Este resultado del an\u00e1lisis funcional complementa otros resultados fundamentales del an\u00e1lisis, como la densidad de polinomios, series de <a href=\"https:\/\/es.wikipedia.org\/wiki\/Joseph_Fourier\" target=\"_blank\" rel=\"noopener\">Fourier<\/a> y funciones suaves con soporte compacto.<\/p>\n<div id=\"attachment_9366\" style=\"width: 348px\" class=\"wp-caption alignleft\"><img decoding=\"async\" aria-describedby=\"caption-attachment-9366\" class=\"wp-image-9366 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_2.png\" alt=\"Figura 2. Movimiento can\u00f3nico iterativo que conduce a la clasificaci\u00f3n por inducci\u00f3n con controles de conmutaci\u00f3n, constantes a trozos (Dom\u00e8nec Ru\u00edz-Balet, Imperial College, Reino Unido).\" width=\"338\" height=\"295\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_2.png 493w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_2-300x262.png 300w\" data-sizes=\"(max-width: 338px) 100vw, 338px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 338px; --smush-placeholder-aspect-ratio: 338\/295;\" \/><p id=\"caption-attachment-9366\" class=\"wp-caption-text\">Figura 2. Movimiento can\u00f3nico iterativo que conduce a la clasificaci\u00f3n por inducci\u00f3n con controles de conmutaci\u00f3n, constantes a trozos (Dom\u00e8nec Ru\u00edz-Balet, Imperial College, Reino Unido).<\/p><\/div>\n<p>El TAU sirve para fines de regresi\u00f3n y clasificaci\u00f3n en el contexto del aprendizaje supervisado (AS). A grandes rasgos, podemos clasificar cualquier conjunto de datos simplemente aproximando la funci\u00f3n caracter\u00edstica -que toma valor 1 en un conjunto de elementos y 0 en el complementario- para, en \u00faltima instancia, asignar la etiqueta correcta a cada elemento.<\/p>\n<p>El hermoso resultado de Cybenko, demostrado empleando el <a href=\"https:\/\/es.wikipedia.org\/wiki\/Teorema_de_Hahn%E2%80%93Banach\" target=\"_blank\" rel=\"noopener\">teorema de Hahn-Banach<\/a>, abri\u00f3 la puerta a una serie de m\u00e9todos que ahora desempe\u00f1an un papel esencial en el AA. En la pr\u00e1ctica, dado que el TAU garantiza la consecuci\u00f3n de todos los objetivos simplemente identificando los par\u00e1metros correctos en el ansatz de Cybenko, podemos adoptar el punto de vista de los m\u00ednimos cuadrados y buscar los valores de los par\u00e1metros que minimicen la distancia a la funci\u00f3n necesaria durante la llamada fase de entrenamiento. Por supuesto, un enfoque tan ingenuo y natural conlleva grandes retos &#8211; \u00a1debemos enfrentarnos simult\u00e1neamente al diablo de la falta de convexidad y a la maldici\u00f3n de la dimensionalidad!<\/p>\n<p><a href=\"https:\/\/es.wikipedia.org\/wiki\/Eduardo_D._Sontag\" target=\"_blank\" rel=\"noopener\">Eduardo Sontag<\/a> y <a href=\"https:\/\/sites.math.rutgers.edu\/~sussmann\/\" target=\"_blank\" rel=\"noopener\">H\u00e9ctor Sussmann<\/a> exploraron el potencial de combinar de la teor\u00eda del control con el TAU, un esfuerzo retomado recientemente por la comunidad matem\u00e1tica, [2, 9]. El ansatz neural conduce ecuaciones diferenciales ordinarias neuronales (EDON)<\/p>\n<p><img decoding=\"async\" class=\"alignnone size-full wp-image-9363 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_4.png\" alt=\"\" width=\"894\" height=\"96\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_4.png 894w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_4-300x32.png 300w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_4-768x82.png 768w\" data-sizes=\"(max-width: 894px) 100vw, 894px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 894px; --smush-placeholder-aspect-ratio: 894\/96;\" \/><\/p>\n<p>que se controlan mediante funciones de activaci\u00f3n, como las funciones sigmoidales (funciones continuas mon\u00f3tonas que toman valor 0 en &#8211; y 1 en +$). Cybenko introdujo estas funciones, bastante at\u00edpicas en mec\u00e1nica, con fines de aproximaci\u00f3n.<\/p>\n<p>La comunidad del control matem\u00e1tico tard\u00f3 muchos a\u00f1os en comprender c\u00f3mo aplicar los m\u00e9todos de control a los retos reales de la AS. Trabajos recientes han demostrado por fin que las redes neuronales residuales profundas (ResNets) -discretizaciones temporales de ODENs- proporcionan la asombrosa e inesperada propiedad del control simult\u00e1neo [8]. Podemos construir controles (es decir, entrenar par\u00e1metros) de tal forma que un n\u00famero arbitrariamente grande de trayectorias lleguen simult\u00e1neamente de forma casi exacta a sus objetivos: las etiquetas que corresponden a los elementos del conjunto de datos a clasificar (v\u00e9ase la Figura 1).<\/p>\n<div id=\"attachment_9369\" style=\"width: 270px\" class=\"wp-caption alignleft\"><img decoding=\"async\" aria-describedby=\"caption-attachment-9369\" class=\"wp-image-9369 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_4.png\" alt=\"Figura 3. Movimiento generado por un sistema de control lineal. Todos los puntos se mueven simult\u00e1neamente sin posibilidad de clasificaci\u00f3n seg\u00fan sus etiquetas (Daniel Veldman, FAU, Erlangen, Alemania).\" width=\"260\" height=\"260\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_4.png 122w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_4-50x50.png 50w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Pic_4-80x80.png 80w\" data-sizes=\"(max-width: 260px) 100vw, 260px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 260px; --smush-placeholder-aspect-ratio: 260\/260;\" \/><p id=\"caption-attachment-9369\" class=\"wp-caption-text\">Figura 3. Movimiento generado por un sistema de control lineal. Todos los puntos se mueven simult\u00e1neamente sin posibilidad de clasificaci\u00f3n seg\u00fan sus etiquetas (Daniel Veldman, FAU, Erlangen, Alemania).<\/p><\/div>\n<p>Esta perspectiva de sistemas din\u00e1micos presenta algunas ventajas interesantes al ofrecer una mejor dependencia de los datos disponibles y la oportunidad de afinar los m\u00e9todos de clasificaci\u00f3n para mejorar las propiedades de estabilidad. Tambi\u00e9n puede explotar muchos de los conocimientos existentes en \u00e1reas m\u00e1s maduras de las matem\u00e1ticas aplicadas. De hecho, la propia naturaleza de la funci\u00f3n de activaci\u00f3n es responsable de la propiedad excepcionalmente potente de control simult\u00e1neo que garantiza los requisitos de AS. El ejemplo m\u00e1s paradigm\u00e1tico es la funci\u00f3n de activaci\u00f3n de la Unidad Lineal Rectificada (ReLU), que simplemente toma el valor 0 cuando x&lt; 0 y 1 cuando x&gt; 0. Cuando se controla mediante la ReLU, una ODEN se comporta como un cubo de Rubik: se puede resolver mediante un n\u00famero finito de operaciones inteligentes mediante las cuales parte del cubo se congela mientras la otra gira en la direcci\u00f3n y sentido adecuados. El objetivo de un cubo de Rubik es garantizar que todas las caras tengan un color homog\u00e9neo. Este objetivo es similar a la tarea realizada por una ODEN, que conduce cada elemento inicial a un determinado dep\u00f3sito distinguido seg\u00fan su etiqueta.<\/p>\n<p>Las pruebas de las que disponemos actualmente son inductivas, mediante \u00a0controles (o par\u00e1metros) constantes a trozos que permiten explotar la esencia del ReLU [8]. En cada instante de tiempo, la ReLU divide el espacio euclidiano en dos semiespacios: (i) uno que se congela a lo largo de la din\u00e1mica porque la no linealidad se anula y (ii) otro que evoluciona exponencialmente, en el que la ReLU est\u00e1 activa. Una elecci\u00f3n estrat\u00e9gica e inductiva de los distintos hiperplanos\/ecuadores (mediante la selecci\u00f3n de los valores de los controles\/par\u00e1metros) y de la direcci\u00f3n de la din\u00e1mica\/viento (mediante el control) garantiza la clasificaci\u00f3n en un n\u00famero finito de pasos (v\u00e9ase la Figura 2).<\/p>\n<p>Estos resultados proporcionan la teor\u00eda de base necesaria para garantizar que las ODENs cumplen las propiedades de controlabilidad simult\u00e1nea que conducen a la clasificaci\u00f3n. Por supuesto, los controles que observamos en las simulaciones num\u00e9ricas suelen ser menos complejos, ya que se calculan como minimizadores de un funcional de coste convenientemente penalizado.<\/p>\n<p>Conviene subrayar que estos resultados se basan fundamentalmente en la<br \/>\nno linealidad de las funciones de activaci\u00f3n. De hecho, la propiedad de controlabilidad del conjunto es imposible para un sistema lineal que m\u00e1s bien se comportar\u00eda como el sistema de la Figura 3, incapaz de clasificar los elementos seg\u00fan las etiquetas.<\/p>\n<p>Los resultados de control aqu\u00ed presentados para ResNets y ODENs pueden trasladarse al marco de las ecuaciones de transporte (advecci\u00f3n, convecci\u00f3n, etc.) mediante el principio cl\u00e1sico de que las trayectorias de las primeras ecuaciones constituyen las caracter\u00edsticas de las segundas:<\/p>\n<p><img decoding=\"async\" class=\"alignnone size-full wp-image-9364 lazyload\" data-src=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_5.png\" alt=\"\" width=\"1148\" height=\"84\" data-srcset=\"https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_5.png 1148w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_5-300x22.png 300w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_5-1024x75.png 1024w, https:\/\/cmc.deusto.eus\/enzuazua\/wp-content\/uploads\/2023\/05\/Formula_5-768x56.png 768w\" data-sizes=\"(max-width: 1148px) 100vw, 1148px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1148px; --smush-placeholder-aspect-ratio: 1148\/84;\" \/><\/p>\n<p>La aproximaci\u00f3n de las distribuciones de masa a transportar mediante medidas at\u00f3micas -cuyos soportes desempe\u00f1an el papel de elementos puntuales en la clasificaci\u00f3n- facilita esa transmutaci\u00f3n.<\/p>\n<p>De este modo el control y el AA tambi\u00e9n se unen en el problema tradicional del transporte de masas, aunque no exactamente de la misma manera que en el transporte \u00f3ptimo o en el problema de Monge-Kantorovich, sino mediante campos vectoriales dependientes del tiempo con la geometr\u00eda sobresimplificada que impone la funci\u00f3n de activaci\u00f3n.<\/p>\n<p>Mis colegas y yo no somos los primeros investigadores en reivindicar las estrechas conexiones entre el control y el AA, [4, 7]. Pero ahora que llevamos varios a\u00f1os trabajando en este tema, nos damos cuenta de que a\u00fan queda mucho por descubrir en el vasto bosque que conecta estas dos \u00e1reas. A\u00f1adir detalles adicionales a esta \u00edntima conexi\u00f3n constituir\u00e1 una aportaci\u00f3n que merece la pena al fascinante mapa global de las ciencias matem\u00e1ticas.<\/p>\n<p>Es probable que nuestra avance en la comprensi\u00f3n de estos temas siga una trayectoria en zigzag que se asemeje a las estrategias para resolver un cubo de Rubik o a las trayectorias que aseguran que las ResNets son capaces de aprender.<\/p>\n<p>Hay otros \u00e1mbitos relacionados y en gran medida inexplorados que merecen tambi\u00e9n la atenci\u00f3n de la comunidad de la \u00a0matem\u00e1tica aplicada. Uno de ellos es el aprendizaje federado, un tema estrechamente relacionado con los m\u00e9todos cl\u00e1sicos de splitting y descomposici\u00f3n de dominios del an\u00e1lisis num\u00e9rico. Actualmente nos interesamos por este tema en colaboraci\u00f3n con la empresa vasca de inteligencia artificial Sherpa.ai (<a href=\"https:\/\/www.sherpa.ai\/\">https:\/\/www.sherpa.ai\/<\/a>), pero dejamos este tema para otra ocasi\u00f3n.<\/p>\n<h4><\/h4>\n<h4><strong>Referencias<\/strong><\/h4>\n<h4>[1] Cybenko, G. (1989). Approximation by superpositions of a single function<em>. Math. Control Signals Syst.<\/em>, <em>2<\/em>, 303-314.<\/h4>\n<h4>[2] E, W. (2017). A proposal on machine learning via dynamical systems.\u00a0<em>Commun. Math. Stat.<\/em>,\u00a0<em>5<\/em>, 1-11.<\/h4>\n<h4>[3] Fern\u00e1ndez-Cara, E., &amp; Zuazua, E. (2003). Control theory: History, mathematical achievements and perspectives. <em>Bol. Soc. Esp. Mat. Apl<\/em>., <em>26<\/em>, 79-140.<\/h4>\n<h4>[4] Fradkov, A.L. (2020). Early history of machine learning. <em>IFAC-PapersOnLine<\/em>, <em>53<\/em>(2), 1385-1390.<\/h4>\n<h4>[5] Geshkovski, B., &amp; Zuazua, E. (2022). Turnpike in optimal control of PDEs, ResNets, and beyond.\u00a0<em>Acta Numer.<\/em>,\u00a0<em>31<\/em>, 135-263.<\/h4>\n<h4>[6] Kalman, R.E. (1960). On the general theory of control systems. <em>IFAC Proc. Vol<\/em>., <em>1<\/em>(1), 491-502.<\/h4>\n<h4>[7] LeCun, Y. (1988). A theoretical framework for back-propagation. In D. Touretzky, G.E. Hinton, &amp; T. Sejnowski (Eds.),\u00a0<em>Proceedings of the 1988 connectionist models summer school <\/em>(pp. 21-28). Pittsburgh, PA: Carnegie Mellon University.<\/h4>\n<h4>[8] Ruiz-Balet, D., &amp; Zuazua, E. (2021). Neural ODE control for classification, approximation and transport. Preprint, <em>arXiv:2104.05278<\/em>.<\/h4>\n<h4>[9] Sontag, E., &amp; Sussmann, H. (1997). Complete controllability of continuous-time recurrent neural networks.\u00a0<em>Syst. Control Lett.<\/em>,\u00a0<em>30<\/em>(4), 177-183.<\/h4>\n<p>&nbsp;<\/p>\n<h5><strong>Enrique Zuazua es titular de la C\u00e1tedra de Din\u00e1mica, Control, Aprendizaje Autom\u00e1tico y Num\u00e9ric &#8211; C\u00e1tedra Alexander von Humboldt en el Departamento de Matem\u00e1ticas de la Friedrich-Alexander- Universit\u00e4t Erlangen-N\u00fcrnberg en Alemania, que compatibiliza con una dedicaci\u00f3n parcial en la Universidad Aut\u00f3noma de Madrid y en la Fundaci\u00f3n Deusto de Bilbao.<\/strong><\/h5>\n<p>&nbsp;<\/p>\n<h6><\/h6>\n<h6>La versi\u00f3n original en ingl\u00e9s de este art\u00edculo fue publicada por la revista SIAM News en Octubre de 2022 bajo el t\u00edtulo \u201cControl and Machine Learning\u201d. El art\u00edculo est\u00e1 basado en la conferencia impartida por el autor, premio W.T. e Idalia Reid 2022, en la Reuni\u00f3n Anual SIAM\u00a0 de \u00a0julio de 2022 en Pittsburgh.<\/h6>\n<h5><\/h5>\n","protected":false},"excerpt":{"rendered":"<p>Hay dos aspectos del origen, historia y estado actual de las matem\u00e1ticas que son objeto de debate recurrente. Su capacidad para describir procesos naturales, industriales y tecnol\u00f3gicos, y la unidad e interconexi\u00f3n de todas las disciplinas matem\u00e1ticas.<\/p>\n","protected":false},"author":3,"featured_media":9370,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[702,94,708],"class_list":["post-9359","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-math-in-motion","tag-aprendizaje-automatico","tag-control","tag-control-y-aprendizaje-automatico"],"_links":{"self":[{"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/posts\/9359","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/comments?post=9359"}],"version-history":[{"count":3,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/posts\/9359\/revisions"}],"predecessor-version":[{"id":9373,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/posts\/9359\/revisions\/9373"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/media\/9370"}],"wp:attachment":[{"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/media?parent=9359"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/categories?post=9359"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cmc.deusto.eus\/enzuazua\/wp-json\/wp\/v2\/tags?post=9359"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}