La IA Claude de Anthropic está jugando Pokémon en Twitch, lentamente

El martes por la tarde, Anthropic lanzó Claude Plays Pokémon en Twitch, una transmisión en vivo del modelo de IA más nuevo de Anthropic, Claude 3.7 Sonnet , jugando una partida de Pokémon Rojo. Se ha convertido en una especie de experimento fascinante, que muestra las capacidades de la tecnología de IA actual y las reacciones de las personas ante ellas.
Los investigadores de IA han utilizado todo tipo de videojuegos , desde Street Fighter hasta Pictionary , para probar nuevos modelos, a menudo más por diversión que por utilidad. Pero Anthropic dijo que Pokémon resultó ser un punto de referencia útil para Claude 3.7 Sonnet, que puede "pensar" eficazmente en los tipos de acertijos que contiene el juego.
Al igual que el o3-mini de OpenAI y el R1 de DeepSeek, Claude 3.7 Sonnet puede "razonar" para superar desafíos difíciles, como jugar un videojuego diseñado para niños. Mientras que el predecesor no racional del modelo, Claude 3.5 Sonnet , falló al comienzo de Pokémon Rojo (saliendo de la casa del jugador en Pueblo Paleta), Claude 3.7 Sonnet logró ganar tres insignias de líder de gimnasio.

Sin embargo, el nuevo Claude sigue teniendo problemas. Horas después de comenzar la transmisión en Twitch, el modelo se vio disuadido por una pared de roca, que no pudo atravesar sin importar cuánto lo intentó.
Un usuario de Twitch resumió la situación de esta manera: "¿Quién ganaría, una IA informática con miles de horas de programación o una pared de roca?"
Finalmente, Claude se dio cuenta de que podía navegar alrededor de la pared.
Por un lado, es frustrante ver a Claude recorrer Pokémon Rojo con la velocidad de un Slowpoke , razonando cada paso con una reflexión insoportable. Sin embargo, también es extrañamente convincente. La izquierda de la transmisión muestra el "proceso de pensamiento" de Claude, mientras que la derecha muestra el juego en tiempo real.
En un momento, Claude intentó localizar al Profesor Oak dentro de su laboratorio, pero se confundió, porque había otros NPC en la escena.
“Observo que ha aparecido un nuevo personaje debajo de mí: un personaje con cabello negro y lo que parece ser una bata blanca en las coordenadas (2, 10)”, escribió Claude. “¡Podría ser el profesor Oak! Déjame bajar y hablar con él”.
Luego, Claude procedió a hablar por error con un NPC que no era el Procesador, un NPC con el que la modelo había hablado varias veces antes. Algunas de las mil personas que estaban en el chat de Twitch comenzaron a ponerse nerviosas. Otros, en particular aquellos que habían estado viendo la transmisión durante más de unos minutos, estaban menos preocupados.
“Tranquilos, chicos”, escribió una persona en el chat. “Antes de salir y entrar al laboratorio de Oak, entramos como 10 veces antes de entender cómo seguir adelante”.

Para los usuarios de Twitch de toda la vida, el formato de la transmisión de Anthropic puede resultar nostálgico. Hace más de una década, millones de personas intentaron jugar Pokémon Rojo a la vez en un experimento social en línea pionero llamado Twitch Plays Pokémon . Cada usuario podía controlar al personaje del jugador a través del chat de Twitch, lo que daba como resultado una jugabilidad previsiblemente caótica.
Algunos investigadores de IA han citado a Twitch Plays Pokémon como inspiración para su trabajo. En octubre de 2023, el ingeniero de software Peter Whidden, con sede en Seattle, publicó un video en YouTube en el que detallaba cómo entrenó un algoritmo de aprendizaje por refuerzo para jugar a Pokémon. Su IA pasó más de 50.000 horas jugando al juego antes de aprender a navegar con éxito. Uno de los desafíos fue que la IA prefería admirar el paisaje pixelado en lugar de jugar realmente el juego.
Las "recreaciones" impulsadas por IA de Pokémon de Twitch Plays como los de Whidden y Anthropic son entretenidas, pero un poco agridulces al mismo tiempo. La transmisión original fue un momento crucial en la historia de Twitch porque unió a la gente de una manera inesperada. Todos estaban en el mismo equipo, trabajando para lograr el objetivo de hacer que el personaje del jugador dejara de correr en círculos y realmente avanzara en el juego.
En 2025, parece que ya no somos compañeros de equipo, sino espectadores que observamos cómo un modelo de IA intenta jugar a un juego que muchos de nosotros aprendimos a hacer cuando teníamos cinco años. Es un microcosmos motivado por la IA de una tendencia más amplia: nuestras experiencias en línea están pasando de ser actividades compartidas y comunitarias a otras más solitarias.
techcrunch