Investigadores de inteligencia artificial han construido un bot de Minecraft(IA en Minecraft) que puede explorar y expandir sus habilidades en el mundo abierto del juego, pero a diferencia de otros bots, este básicamente escribió su propio código a través de prueba y error y muchas consultas a GPT-4.
Llamado Voyager, este sistema experimental es un ejemplo de un «agente incorporado«, una IA que puede moverse y actuar libre y deliberadamente en un entorno simulado o real. Los asistentes personales y los chatbots no tienen que hacer realmente cosas, y mucho menos navegar por un mundo complejo para realizar esas tareas. Sin embargo, eso es exactamente lo que se espera que haga un robot doméstico en el futuro, por lo que se está investigando mucho sobre cómo podrían lograrlo.
Minecraft es un buen lugar para probar este tipo de cosas porque es una representación muy (muy) aproximada del mundo real, con reglas y física simples y directas, pero también es lo suficientemente complejo y abierto como para tener mucho por hacer o probar. Los simuladores específicamente creados también son excelentes, pero tienen sus propias limitaciones.
MineDojo es un marco de simulación construido alrededor de Minecraft, ya que no se puede simplemente colocar una IA aleatoria y esperar que comprenda qué están haciendo todos estos bloques y cerdos. Sus creadores (con mucha superposición con el equipo de Voyager) han creado videos de YouTube sobre el juego, transcripciones, artículos de wiki y muchos mensajes de Reddit de r/minecraft, entre otros datos, para que los usuarios puedan crear o ajustar un modelo de IA basado en ellos. También permite evaluar esos modelos de manera más o menos objetiva al ver qué tan bien hacen cosas como construir una cerca alrededor de una llama o encontrar y extraer un diamante.
Voyager se destaca en estas tareas, funcionando mucho mejor que el único otro modelo que se acerca, Auto-GPT. Pero tienen un enfoque similar: usar GPT-4 para escribir su propio código a medida que avanzan.
Normalmente, solo entrenarías un modelo con todos esos buenos datos de Minecraft y esperarías que descubriera cómo luchar contra esqueletos cuando se pone el sol. Sin embargo, Voyager comienza relativamente ingenuo y, a medida que encuentra cosas en el juego, tiene una pequeña conversación interna con GPT-4 sobre lo que debería hacer y cómo.

Por ejemplo, cuando cae la noche y aparecen esos esqueletos. El agente tiene una idea general de esto, pero se pregunta: ¿qué haría un buen jugador de este juego cuando hay monstruos cerca? Bueno, dice GPT-4, si quieres explorar el mundo de manera segura, querrás hacer y equiparte con una espada, luego golpear al esqueleto con ella evitando ser golpeado. Y esa noción general de qué hacer se traduce en objetivos concretos: recolectar piedra y madera, construir una espada en la mesa de trabajo, equiparla y luchar contra un esqueleto.
Una vez que ha realizado esas acciones, se registran en una biblioteca de habilidades generales para que más adelante, cuando la tarea sea «adentrarse en una cueva para encontrar mineral de hierro»,
no tenga que aprender a luchar de nuevo desde cero. Aún utiliza GPT, pero utiliza GPT-3.5, que es más económico y rápido, para indicarle las habilidades más relevantes para una situación dada, para que no intente extraer al esqueleto y luchar contra el mineral.
Es similar a un agente como Auto-GPT que, cuando se enfrenta a una interfaz que aún no conoce, tiene que enseñarse a navegar por ella para lograr su objetivo. Pero Minecraft es un entorno mucho más profundo de lo que está acostumbrado a resolver, por lo que un agente especializado como Voyager lo hace mucho mejor. Encuentra más cosas, aprende más habilidades y explora un área mucho mayor que los otros bots.
Interesante pero quizás no sorprendentemente, GPT-4 supera ampliamente a GPT-3.5 (es decir, ChatGPT) cuando se trata de generar código útil. Una prueba reemplazando al primero por el segundo hizo que el agente se estancara temprano, quizás incluso literalmente, y no lograra mejorar. Puede que no sea obvio al hablar con los dos modelos que uno es mucho más inteligente, pero la verdad es que no tienes que ser particularmente inteligente para mantener una conversación aparentemente inteligente (pregúntame cómo lo sé). La programación es mucho más difícil y GPT-4 fue una gran actualización en ese aspecto.
El objetivo de esta investigación no es volver obsoletos a los jugadores de Minecraft, sino encontrar métodos mediante los cuales modelos de IA relativamente simples puedan mejorar basándose en sus «experiencias», por falta de una mejor palabra. Si vamos a tener robots que nos ayuden en nuestros hogares, hospitales y oficinas, deberán aprender y aplicar esas lecciones a acciones futuras.