aprendizaje profundo

Aprendizaje profundo: una mirada en profundidad a la tecnología basada en IA

El aprendizaje profundo está ayudando a las industrias a lograr grandes avances, pero ¿es revolucionario o simplemente una «herramienta útil» destinada a la extinción?

En este articulo

Es un día ajetreado en 2039 y estás viendo una película mientras te transporta uno de los innumerables vehículos autónomos que merodean por las carreteras del mundo. Frena y acelera cuando es necesario, evita chocar contra cosas (otros coches, ciclistas, gatos callejeros), obedece todas las señales de tráfico y permanece siempre dentro de los marcadores de carril.

No hace mucho tiempo, tal escenario habría parecido ridículo. Ahora está cada vez más firmemente en el reino de lo posible. De hecho, los vehículos autónomos algún día pueden volverse tan conscientes de su entorno que los accidentes serán prácticamente inexistentes. Sin embargo, llegar a ese punto requiere superar una serie de obstáculos utilizando una variedad de procesos complejos, incluido el aprendizaje profundo. Pero, ¿hasta dónde puede llevarnos la tecnología?

«El aprendizaje profundo está resolviendo un problema y es una herramienta útil para nosotros», dice Xiang Ma, experto en aprendizaje automático y gerente de investigación veterano de HERE Technologies en Chicago, que trabaja en el desarrollo de sistemas de navegación sofisticados para vehículos autónomos. « Y sabemos que está funcionando. Pero podría ser solo una tecnología provisional. No sabemos qué sigue».

que es el aprendizaje profundo
El aprendizaje profundo es una forma de aprendizaje automático que es un subconjunto de la inteligencia artificial.

¿Qué es el aprendizaje profundo?

Una forma recientemente revigorizada de aprendizaje automático, que en sí mismo es un subconjunto de la inteligencia artificial , el aprendizaje profundo emplea computadoras potentes, conjuntos de datos masivos, redes neuronales «supervisadas» (entrenadas) y un algoritmo llamado retropropagación (backprop para abreviar) para reconocer objetos y traducir el habla en tiempo real imitando las capas de neuronas en la neocorteza del cerebro humano.

Aprendizaje profundo: una explicación rápida

El aprendizaje profundo (a veces conocido como aprendizaje estructurado profundo) es un subconjunto del aprendizaje automático, donde las máquinas emplean redes neuronales artificiales para procesar información. Inspirado en los nodos biológicos del cuerpo humano, el aprendizaje profundo ayuda a las computadoras a reconocer y procesar rápidamente imágenes y voz. Luego, las computadoras «aprenden» lo que representan estas imágenes o sonidos y construyen una enorme base de datos de conocimiento almacenado para tareas futuras. En esencia, el aprendizaje profundo permite que las computadoras hagan lo que los humanos hacen naturalmente: aprender por inmersión y ejemplo.

El aprendizaje profundo existe desde la década de 1950, pero su ascenso a estrella en el campo de la inteligencia artificial es relativamente reciente. En 1986, el científico informático pionero Geoffrey Hinton, ahora investigador de Google y conocido durante mucho tiempo como el «padrino del aprendizaje profundo», fue uno de los varios investigadores que ayudaron a que las redes neuronales volvieran a ser geniales, científicamente hablando, al demostrar que más de unas pocas de ellas podría entrenarse usando retropropagación para mejorar el reconocimiento de formas y la predicción de palabras. Para 2012, el aprendizaje profundo se usaba en todo, desde aplicaciones de consumo como Siri de Apple hasta la investigación farmacéutica.

Relacionado: Historia del aprendizaje profundo: momentos formativos que dieron forma a la tecnología

“El punto sobre este enfoque es que escala maravillosamente”, dijo Hinton al New York Times. “Básicamente, solo necesitas seguir haciéndolo más grande y más rápido, y mejorará. Ya no hay vuelta atrás».

Cómo funciona el aprendizaje profundo

Fabricación del automóvil autónomo de próxima generación 

El equipo de Ma en HERE  crea mapas de alta definición que mejoran en gran medida las capacidades de percepción a bordo de un vehículo y construyen el sistema de navegación para viajes futuros. El aprendizaje profundo es crucial para ese proceso.

“Algunas personas dicen que podemos vivir sin mapas HD, que simplemente podemos poner una cámara en el vehículo”, dice Ma después de conducir con orgullo un recorrido por el espacio de su oficina y mostrar la máquina de café futurista de la empresa (¡pruebe el café con leche!). “Pero no importa cuán buena sea su cámara, siempre tendrá un caso de falla. No importa qué tan bueno sea tu algoritmo, siempre te pierdes algo. Entonces, en el caso de que sus sensores estén rotos, el mapa es su último recurso”.

A través de su desarrollo de algoritmos automatizados y una canalización de datos escalable (un sistema, en este caso, decenas de miles de computadoras basadas en la nube que ejecutan algoritmos paralelos, que pueden manejar una cantidad cada vez mayor de datos de entrada sin dejar de funcionar como se espera, sin bloqueos ni ralentizaciones) , él y su equipo construyen mapas de alta definición utilizando varias fuentes de datos seleccionadas por sensores en los automóviles de los principales propietarios de HERE, BMW, Mercedes y Audi.

Debido a que es importante comenzar con datos de entrenamiento precisos, explica Ma, el etiquetado humano es un primer paso crucial en el proceso. Las imágenes de Street View y Lidar (un sistema de detección similar a un radar que utiliza luz láser para recopilar formas 3D precisas del mundo) combinadas con información de marcación de carriles que al principio se codifica manualmente se alimenta a un motor de aprendizaje profundo que se procesa repetidamente («iterativamente», va la jerga) mejorado y reentrenado. Luego, el modelo de aprendizaje profundo se «implementa» (usado en, más jerga) en una tubería de producción para detectar automáticamente las marcas de carril hasta el centímetro. Los humanos ingresan nuevamente a la ecuación para verificar que todas las medidas sean correctas. 

Idealmente, dice Ma, muchos más fabricantes de vehículos aceptarán compartir los datos de sus sensores (pero ninguna información de identificación personal que pueda generar problemas de privacidad) para que los vehículos autónomos puedan aprender unos de otros y beneficiarse de las actualizaciones en vivo. Por ejemplo, digamos que hay un choque de seis autos cinco millas más adelante de su ubicación actual. El primer vehículo en detectar ese choque en cadena transmitiría la información a una fuente central, AQUÍ, que a su vez la transmitiría a todos los vehículos que se acercaran al lugar del accidente. Todavía es un trabajo en progreso, pero Ma confía en su eficacia.

alcance del aprendizaje profundo alphago
El «aprendizaje de refuerzo profundo» de DeepMind condujo al desarrollo de un software llamado AlphaGo y su hermano más avanzado AlphaGo Zero, los cuales derrotaron fácilmente a los campeones mundiales humanos en el antiguo juego chino de Go en 2016. | Crédito: Shutterstock

El alcance y el impacto del aprendizaje profundo

¿Revolucionaria o simplemente una herramienta útil? 

En un artículo del New Yorker de 2012, el profesor e investigador de aprendizaje automático de la Universidad de Nueva York, Gary Marcus, expresó su renuencia a saludar el aprendizaje profundo como una especie de revolución en la inteligencia artificial. Si bien fue un «trabajo importante, con aplicaciones prácticas inmediatas», sin embargo representó «solo un pequeño paso hacia la creación de máquinas verdaderamente inteligentes».

“Siendo realistas, el aprendizaje profundo es solo una parte del desafío mayor de construir máquinas inteligentes”, explicó Marcus. “Tales técnicas carecen de formas de representar relaciones causales (como entre enfermedades y sus síntomas), y es probable que enfrenten desafíos para adquirir ideas abstractas como ‘hermano’ o ‘idéntico a’. No tienen formas obvias de realizar inferencias lógicas, y todavía están muy lejos de integrar el conocimiento abstracto, como información sobre qué son los objetos, para qué sirven y cómo se usan normalmente”.

Era como el martillo dorado de Thor. Donde se aplica, es mucho más efectivo. En algunos casos, ciertas aplicaciones pueden subir el dial varias muescas para obtener un rendimiento sobrehumano.

Ahora, seis años después, el aprendizaje profundo es más sofisticado gracias en gran parte a una mayor potencia informática (procesamiento de gráficos, en particular) y avances algorítmicos (particularmente en el campo de las redes neuronales). También se aplica más ampliamente: en diagnósticos médicos , búsqueda por voz, generación automática de texto e incluso predicción meteorológica, por nombrar algunas áreas.

“La potencia de esto fue realmente cuando la gente descubrió que se podía aplicar el aprendizaje profundo a muchos problemas”, dice  el fundador de Guild AI , Garrett Smith, quien también dirige la organización de aprendizaje automático Chicago ML . “Era como el martillo dorado de Thor. Donde se aplica, es mucho más efectivo. En algunos casos, ciertas aplicaciones pueden subir el dial varias muescas para obtener un rendimiento sobrehumano”.

DeepMind, de nueve años de Google, que adquirió en 2014, es líder en ese ámbito, y su objetivo es nada menos que «resolver la inteligencia» mediante la fusión del aprendizaje automático y la neurociencia. Los estudios de la empresa con sede en Gran Bretaña sobre el «aprendizaje de refuerzo profundo», una combinación de aprendizaje profundo basado en redes neuronales y aprendizaje de refuerzo basado en prueba y error, llevaron al desarrollo de un software llamado AlphaGo y su hermano más avanzado AlphaGo Zero, ambos de los cuales golpearon fácilmente a los campeones mundiales humanos en el antiguo juego chino de Go en 2016.

Recientemente, DeepMind y la organización de investigación de IA sin fines de lucro OpenAI unieron fuerzas para publicar un artículo titulado «Recompense el aprendizaje de las preferencias humanas y las demostraciones en Atari». Su tesis en resumen: la comunicación humana de objetivos funciona mejor que un sistema de recompensas cuando se trata de resolver problemas complejos del mundo real. En ese sentido, las empresas emplearon una combinación de retroalimentación humana y un proceso llamado «optimización del aprendizaje por refuerzo» para lograrrendimiento sobrehumano en dos de los juegos y resultados superiores a la línea de base en los otros siete. Lo que significa, esencialmente, que las máquinas aprendieron a jugar videojuegos al ver a las personas jugar videojuegos y, en dos casos, superaron ampliamente a sus contrapartes humanas. Y no podemos olvidarnos de Facebook, cuyo gigante de las redes sociales y de la inteligencia artificial ideó la tecnología detrás de DeepFace, que puede identificar rostros en fotos con una precisión humana.

La ciencia también ha seguido beneficiándose del aprendizaje automático (profundo).  

“Ahora existe una conexión más orgánica entre el aprendizaje automático y la ciencia”, dice la profesora de informática de la Universidad de Chicago, Risi Kondor. “No es solo una cosa molesta que tienes que hacer aparte porque hay demasiados datos en tu disco duro; realmente se está convirtiendo en una parte integral del proceso de descubrimiento científico”.

La dinámica molecular, que consiste en simular las trayectorias de átomos y moléculas para aprender cómo se comporta un sólido o un sistema biológico bajo estrés, o cómo las moléculas de fármacos se unen a sus receptores, es un ejemplo. En poco tiempo, predicen los expertos, el diseño molecular estará completamente automatizado, lo que acelerará el desarrollo de fármacos.  

La promesa de las redes neuronales

El mayor cambio reciente en el aprendizaje profundo es la profundidad de las redes neuronales, que han pasado de unas pocas capas a cientos de ellas. Más profundidad significa una mayor capacidad para reconocer patrones, lo que aumenta el reconocimiento de objetos y el procesamiento del lenguaje natural. El primero tiene ramificaciones de mayor alcance que el segundo.

“La traducción [de idiomas] es un gran problema, y ​​ha habido aplicaciones asombrosas ”, dice Smith. “Tienes más flexibilidad en términos de que las redes puedan hacer predicciones en idiomas que nunca han visto antes. Pero hay un límite a la aplicabilidad general de la traducción. Lo hemos estado haciendo durante un tiempo, y no es un gran cambio de juego. Lo de la visión es lo que realmente está impulsando una gran cantidad de innovación notable. Poner un detector en un automóvil para que pueda juzgar con precisión su entorno, eso lo cambia todo”.

desafíos de aprendizaje profundo

Desafíos en el aprendizaje profundo

¿Cómo resolvemos el problema de los datos?

El «elefante deslumbrante en la habitación» cuando se trata de aprendizaje profundo, dice Smith, son los datos, no tanto la calidad como la cantidad, ya que los modelos de aprendizaje automático/profundo son «notablemente resistentes a los datos pésimos».

“Básicamente estás representando el conocimiento, la capacidad de realizar un procesamiento complejo”, dice. “Para hacer eso, necesitas más neuronas y más capacidad. Necesita datos que generalmente no están disponibles”.

Lo que significa que los modelos previamente entrenados (creados por otra persona y fácilmente disponibles en línea) y los conjuntos de datos públicos (ídem) no serán suficientes. Ahí es donde los gigantes multimillonarios del aprendizaje automático tienen una clara ventaja.

One-Shot Learning y NAS: una combinación poderosa

Sin embargo, un par de desarrollos potencialmente transformadores podrían servir para que el aprendizaje profundo sea más rápido e igualitario. Uno crucial es la capacidad de los modelos para aprender utilizando muchos menos datos, también conocido como «aprendizaje de una sola vez», que aún está en pañales.

Eso es enorme, dice Smith.

También existe la «búsqueda de arquitectura neuronal» (NAS), mediante la cual un algoritmo encuentra la mejor arquitectura de red neuronal. Su combinación con el aprendizaje de una sola vez lo convierte en un emparejamiento poderoso.

GAN: el enfoque del gato y el ratón

En la búsqueda por superar el aprendizaje profundo, también ha habido un gran alboroto en torno a las redes adversarias generativas. Típicamente conocidas como GAN, consisten en dos redes neuronales (una red «generadora» que crea nuevos datos y una «discriminadora» que decide si esos datos son auténticos) que se enfrentan entre sí para afectar algo parecido a la imaginación artificial. Como dice una explicación:

Puede pensar en una GAN como la combinación de un falsificador y un policía en un juego del gato y el ratón, donde el falsificador aprende a pasar billetes falsos y el policía aprende a detectarlos. Ambos son dinámicos; es decir, el policía también está entrenando (quizás el banco central está marcando los billetes que se escabulleron), y cada lado viene a aprender los métodos del otro en una escalada constante”.

AutoML: ¿una nueva forma de aprendizaje profundo?

Luego está la aplicación del aprendizaje automático al aprendizaje automático. Llamado AutoML, se basa en una instrucción de «aprender a aprender» que impulsa a las computadoras, a través de un proceso de aprendizaje, a diseñar arquitecturas innovadoras (reglas y métodos) por su cuenta.

Muchas personas llaman a AutoML la nueva forma de hacer aprendizaje profundo, un cambio en todo el sistema”, explica un ensayo reciente enwardsdatascience.com. En lugar de diseñar redes profundas complejas, simplemente ejecutaremos un algoritmo NAS preestablecido. Esta idea de AutoML es simplemente abstraer todas las partes complejas del aprendizaje profundo. Todo lo que necesitas son datos. ¡Deje que AutoML haga la parte difícil del diseño de la red! El aprendizaje profundo se convierte literalmente en una herramienta de complemento como cualquier otra. Tome algunos datos y cree automáticamente una función de decisión impulsada por una red neuronal compleja”.

El director de investigación de inteligencia artificial de Facebook, Yann LeCunn, y el profesor de la Universidad de Nueva York y experto en aprendizaje automático, Gary Marcus, se enfrentan.

El futuro del aprendizaje profundo

¿Evolución o extinción?

Pero si bien Kondor, Smith, Ma y otros aprecian el progreso que ha logrado el aprendizaje profundo, también son realistas (en el caso de Ma, de hecho fatalistas) acerca de sus límites.

“Estas tareas en las que el aprendizaje profundo ha sido realmente espectacularmente poderoso son exactamente el tipo de tareas en las que los informáticos han estado trabajando durante mucho tiempo porque están bien definidas y hay mucho interés comercial detrás de ellas”, dice Kondor. “Así que es cierto que el reconocimiento de objetos es completamente diferente de lo que era hace 12 años, pero sigue siendo solo reconocimiento de objetos; no son exactamente tareas cognitivas profundas de alto nivel. Hasta qué punto estamos hablando realmente de inteligencia es una cuestión de especulación”.

En un ensayo de Medium publicado en diciembre pasado y titulado «El problema más profundo con el aprendizaje profundo», Gary Marcus ofreció una versión actualizada de su examen del tema en el New Yorker de 2012. En él, hizo referencia a una entrevista con el profesor de ciencias de la computación de la Universidad de Montreal, Yoshua Bengio, quien sugirió la “necesidad de considerar los desafíos difíciles de la IA y no estar satisfecho con avances incrementales a corto plazo. No digo que quiera olvidar el aprendizaje profundo. Al contrario, quiero construir sobre ello. Pero necesitamos poder extenderlo para hacer cosas como razonar, aprender causalidad y explorar el mundo para aprender y adquirir información”.

Marcus «estuvo prácticamente de acuerdo con cada palabra» y cuando publicó el artículo científico «Aprendizaje profundo: una evaluación crítica» en enero de 2018, sus pensamientos sobre por qué los problemas con el aprendizaje profundo están impidiendo el desarrollo de la inteligencia artificial general (AGI) causaron una reacción violenta en línea. En una serie de tuits, Thomas G. Dietterich, distinguido profesor emérito de la Universidad Estatal de Oregón y expresidente de la Asociación para el Avance de la Inteligencia Artificial, defendió el aprendizaje profundo y señaló que “funciona mejor que nada GOFAI [Good Old-Fashioned Artificial Inteligencia] jamás producida”.

Aún así, incluso el «Padrino del aprendizaje profundo» ha cambiado de tono, diciéndole a Axios que se ha vuelto «profundamente sospechoso» de la propagación hacia atrás, que subyace en el aprendizaje profundo.

“No creo que sea así como funciona el cerebro”, dijo Hinton. «Nosotros [los humanos] claramente no necesitamos todos los datos etiquetados».

Su solución: “tíralo todo y empieza de nuevo”.

Sin embargo, ¿son realmente necesarias medidas tan drásticas? Puede ser, como dijo el director de investigación de IA de Facebook, Yann LeCunn , a VentureBeat , que el aprendizaje profundo debería deshacerse del popular pero a veces problemático lenguaje de codificación Python en favor de uno que sea más simple y maleable. Por otra parte, agregó LeCun, tal vez se necesite nuevo hardware. En cualquier caso, una cosa está clara: el aprendizaje profundo debe evolucionar o corre el riesgo de desaparecer. Aunque lograr lo primero, dicen los expertos, no excluye lo segundo.

El cerebro humano es complejo. El aprendizaje profundo no lo es.

“El aprendizaje profundo actual es solo una herramienta basada en datos”, dice Ma de HERE. “Pero definitivamente todavía no es autoaprendizaje”.

No solo eso, sino que todavía nadie sabe cuántas neuronas son necesarias para que sea de autoaprendizaje. Además, desde un punto de vista biológico, se sabe relativamente poco sobre el cerebro humano, ciertamente no lo suficiente como para crear un sistema que se acerque a imitarlo. En este punto, dice Ma, incluso su hija de tres años tiene ritmo de aprendizaje profundo.  

“Si le muestro una imagen [única] de un elefante y luego ve una imagen diferente de un elefante, inmediatamente puede reconocer que es un elefante porque ya conocía la forma y puede imaginarla en su cerebro. Pero el aprendizaje profundo fallaría en este problema, porque carece de la capacidad de aprender de unas pocas muestras. Todavía dependemos de cantidades masivas de datos de entrenamiento”.

Por ahora, dice Ma, el aprendizaje profundo es simplemente un método útil que se puede implementar para resolver varios problemas. Como tal, piensa, su extinción no es inminente. Sin embargo, es probable.

“Tan pronto como sepamos qué sigue, cambiaremos a eso. Porque esta no es la solución definitiva”.