Premio Turing para dos pioneros de la IA y sus técnicas de adiestramiento

0
7
Cortesía: thefusioneer.com

El entrenamiento de máquinas mediante técnicas similares a las empleadas por los adiestradores de animales, moldeando el comportamiento a través de recompensas y castigos, ha sido fundamental en el desarrollo de la inteligencia artificial. Este método innovador ha sido reconocido con el prestigioso Premio A.M. Turing, el equivalente al Nobel en el mundo de la tecnología.

Andrew Barto y Richard Sutton, pioneros en el campo del aprendizaje por refuerzo, han sido galardonados con este importante premio.  Su trabajo, iniciado a finales de la década de 1970, sentó las bases para muchos de los avances en IA de la última década.

La investigación de Barto y Sutton se centró en el desarrollo de máquinas «hedonistas», capaces de adaptar su comportamiento en respuesta a señales positivas.  Este enfoque, conocido como aprendizaje por refuerzo, ha sido crucial en logros como la victoria de un programa de Google sobre los mejores jugadores humanos de Go, la optimización de herramientas de IA como ChatGPT, la mejora del comercio financiero y el control de robots para tareas complejas como resolver un cubo de Rubik.

A pesar de su importancia actual, el aprendizaje por refuerzo no siempre fue un campo popular.  Barto y Sutton, en sus inicios en la Universidad de Massachusetts, Amherst, trabajaron en un ambiente poco reconocido.  El premio Turing representa un reconocimiento a su perseverancia y la relevancia de su trabajo.

El premio, patrocinado por Google y otorgado por la Association for Computing Machinery, tiene un valor de un millón de dólares.  Barto, actualmente retirado, y Sutton, profesor en la Universidad de Alberta, se unen a la lista de pioneros de la IA galardonados con este premio, que lleva el nombre de Alan Turing.

La investigación de Barto y Sutton responde directamente al desafío planteado por Turing en 1947: crear una máquina capaz de aprender de la experiencia.  El aprendizaje por refuerzo, según Sutton, es la esencia de esta idea, inspirándose en la psicología y la neurociencia, específicamente en la forma en que las neuronas responden a recompensas y castigos.

En un artículo fundamental de la década de 1980, Barto y Sutton aplicaron su enfoque a una tarea simulada: equilibrar un palo sobre un carro en movimiento.  Posteriormente, coescribieron un libro de texto ampliamente utilizado sobre el aprendizaje por refuerzo, consolidando su influencia en el campo.

El impacto de su trabajo es innegable, según Jeff Dean de Google, ya que ha sido fundamental en el auge de la IA, atrayendo a numerosos investigadores e impulsando grandes inversiones.  Sin embargo, Barto y Sutton mantienen diferentes perspectivas sobre los riesgos de la IA auto-mejorable.

Barto y Sutton distinguen su trabajo del campo de la IA generativa, representado por modelos de lenguaje como los que impulsan los chatbots.  Sutton destaca la diferencia entre aprender de datos humanos y aprender de la experiencia de un agente de IA, enfatizando la importancia de este último enfoque.

Con información de Diario Libre

Obtén información al instante, únete a nuestra comunidad digital

Síguenos en nuestras cuentas de Redes Sociales

Instagram: @dominicananews24oficial

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí