Los científicos proponen una nueva forma de implementar una red neuronal con un sistema óptico que podría hacer que el aprendizaje automático sea más sostenible en el futuro. Los investigadores del Instituto Max Planck para la Ciencia de la Luz han publicado su nuevo método en Nature Physics, demostrando un método mucho más simple que los enfoques anteriores.
El aprendizaje automático y la inteligencia artificial se están volviendo cada vez más extendidos con aplicaciones que van desde la visión por computadora hasta la generación de texto, como lo demuestra ChatGPT. Sin embargo, estas tareas complejas requieren redes neuronales cada vez más complejas; algunas con miles de millones de parámetros. Este rápido crecimiento del tamaño de las redes neuronales ha puesto a las tecnologías en un camino insostenible debido a su consumo de energía y tiempos de entrenamiento exponencialmente crecientes. Por ejemplo, se estima que el entrenamiento de GPT-3 consumió más de 1,000 MWh de energía, lo que equivale al consumo diario de energía eléctrica de una pequeña ciudad. Esta tendencia ha creado la necesidad de alternativas más rápidas, más eficientes en energía y costo, lo que ha impulsado el campo de rápida evolución de la computación neuromórfica. El objetivo de este campo es reemplazar las redes neuronales en nuestras computadoras digitales con redes neuronales físicas. Estas están diseñadas para realizar las operaciones matemáticas requeridas físicamente de una manera potencialmente más rápida y eficiente en energía.
La óptica y la fotónica son plataformas particularmente prometedoras para la computación neuromórfica, ya que el consumo de energía puede mantenerse al mínimo. Los cálculos se pueden realizar en paralelo a velocidades muy altas limitadas solo por la velocidad de la luz. Sin embargo, hasta ahora, ha habido dos desafíos importantes: en primer lugar, para realizar los cálculos matemáticos complejos necesarios se requieren altas potencias láser. En segundo lugar, la falta de un método general de entrenamiento eficiente para tales redes neuronales físicas.
Ambos desafíos se pueden superar con el nuevo método propuesto por Clara Wanjura y Florian Marquardt del Instituto Max Planck para la Ciencia de la Luz en su nuevo artículo en Nature Physics. “Normalmente, la entrada de datos se imprime en el campo de luz. Sin embargo, en nuestros nuevos métodos proponemos imprimir la entrada cambiando la transmisión de luz”, explica Florian Marquardt, director del instituto. De esta manera, la señal de entrada se puede procesar de forma arbitraria. Esto es cierto incluso aunque el campo de luz en sí se comporte de la manera más simple posible en la que las ondas interfieren sin influenciarse mutuamente. Por lo tanto, su enfoque permite evitar las complejas interacciones físicas para realizar las funciones matemáticas requeridas que de otro modo requerirían campos de luz de alta potencia. La evaluación y el entrenamiento de esta red neuronal física sería entonces muy sencillo: “Realmente sería tan simple como enviar luz a través del sistema y observar la luz transmitida. Esto nos permite evaluar la salida de la red. Al mismo tiempo, esto permite medir toda la información relevante para el entrenamiento”, dice Clara Wanjura, la primera autora del estudio. Los autores demostraron en simulaciones que su enfoque se puede utilizar para realizar tareas de clasificación de imágenes con la misma precisión que las redes neuronales digitales.
En el futuro, los autores planean colaborar con grupos experimentales para explorar la implementación de su método. Dado que su propuesta relaja significativamente los requisitos experimentales, se puede aplicar a muchos sistemas físicamente muy diferentes. Esto abre nuevas posibilidades para dispositivos neuromórficos que permiten el entrenamiento físico en una amplia gama de plataformas.
Journal
Nature Physics
Method of Research
Estudio experimental
Subject of Research
No aplicable
Article Title
Computación neuromórfica completamente no lineal con dispersión de ondas lineales
Article Publication Date
9-Jul-2024