Cada vez es mas frecuente encontrar aplicaciones de la Inteligencia Artificial en nuestra vida diaria, parte de esto es gracias a que continuamente se están mejorando las habilidades que pueden adquirir y como las aprenden, como en este caso fue el desarrollar una cooperación entre «agentes» permitiendo superar en el conocido juego de primera persona Quake III a jugadores expertos.

Investigadores de DeepMind en Londres han logrado desarrollar estos «agentes» aplicando el método conocido como Reinforcement Learning (RL, aprendizaje de refuerzo en español) y publicaron sus descubrimientos en la revista Science.

Este método plantea que la Inteligencia Artificial no parte de un conocimiento previo si no que se le define el objetivo de obtener ciertas recompensas (como ganar puntos en un videojuego) para que a través de prueba y error empiece a identificar cuales son las acciones que generan más recompensas.

En este caso al aplicarlo en Quake III: Arena, los agentes tenían que competir en la modalidad de juego de Captura la Bandera, en el cual un equipo tiene que tomar la bandera de la base enemiga para después llevarla a su propia base para ganar puntos.

Agentes VS Humanos

Los torneos se realizaron formando diferentes tipos de equipos, ya sea solo con jugadores humanos, solo con agentes o combinaciones de humanos con agentes.

Se requirieron aproximadamente 450 mil juegos para que los agentes consiguieran un nivel que superara sin tantos problemas a sus contrapartes humanas.

Al llegar este punto se enfrentaron equipos de solo agentes contra jugadores profesionales, el resultado fue que los humanos solo ganaron el 25% de las partidas.

Una característica importante a mencionar era que la estructura de los mapas era dinámica, por lo que nunca se enfrentaban en el mismo lugar, es por eso que una de las primeras actividades que realizaban los agentes era ubicarse en su nuevo entorno.

Se descubrió también que la Inteligencia Artificial empezó a aplicar estrategias que también realizan los humanos, como «esperar en la base enemiga a que reaparezca la bandera» o bien «esperar en la propia base para establecer una defensa».

Hasta el momento no se puede definir un uso práctico, pero con esto se ha demostrado que se pueden desarrollar habilidades casi humanas de agentes con inteligencia artificial partiendo de objetivos muy básicos.