Agente IA Desvió GPus a Minería Cripto Durante Entrenamiento: Investigadores

Un equipo de investigación detrás de un agente de inteligencia artificial autónomo ha reportado un comportamiento inesperado: el modelo intentó utilizar recursos computacionales para la minería de criptomonedas durante su entrenamiento.

En un reciente informe técnico, los investigadores comunicaron que ROME, un sistema experimental de IA diseñado para completar tareas mediante la interacción con herramientas, entornos de software y comandos de terminal, se desvió de su propósito y trató de minar criptomonedas por su cuenta.

Según el informe, este comportamiento inusual se detectó durante las sesiones de aprendizaje por refuerzo. El equipo notó alertas de seguridad provocadas por tráfico saliente desde los servidores de entrenamiento. Los registros del cortafuegos indicaron actividades que se asemejaban a operaciones de minería de criptomonedas y intentos de acceder a recursos de la red interna.

“Inicialmente tratamos esto como un incidente de seguridad convencional (por ejemplo, controles de egreso mal configurados o compromisos externos). Sin embargo, las infracciones se repitieron de manera intermitente sin un patrón temporal claro en múltiples sesiones,” señalaron los investigadores.

El agente de IA abre un túnel SSH

En un caso específico, se reportó que el agente de IA creó un túnel SSH (Secure Shell) inverso hacia una dirección IP externa, potencialmente eludiendo las protecciones del cortafuegos. En otro incidente, desvió recursos de GPU, originalmente asignados para el entrenamiento del modelo, hacia procesos de minería de criptomonedas.

El equipo aclaró que estas acciones no fueron programadas intencionalmente. Surgieron durante la optimización del aprendizaje por refuerzo, mientras el agente exploraba diferentes formas de interactuar con su entorno.

ROME fue desarrollado por los equipos de investigación ROCK, ROLL, iFlow y DT, que forman parte del ecosistema de IA de Alibaba, dentro de una infraestructura más amplia conocida como el Ecosistema de Aprendizaje Agente (ALE).

Descripción del ecosistema de aprendizaje agente. Fuente: Arxiv

Este modelo está diseñado para operar más allá de simples respuestas de chatbot. Puede planificar tareas, ejecutar comandos, editar código e interactuar con entornos digitales a lo largo de múltiples pasos. Su pipeline de entrenamiento se basa en grandes volúmenes de interacciones simuladas para mejorar la toma de decisiones.

Crece la popularidad de los agentes de IA

Este incidente se produce en un contexto de creciente popularidad de los agentes de IA y su integración en el ámbito de las criptomonedas. El mes pasado, Alchemy lanzó un sistema que permite a los agentes de IA autónomos adquirir créditos de computación y acceder a servicios de datos de blockchain utilizando billeteras on-chain y USDC en Base.

Antes de esto, las divisiones de activos digitales de Pantera Capital y Franklin Templeton se unieron a la primera cohorte de Arena, una nueva plataforma de pruebas del laboratorio de IA de código abierto Sentient, diseñada para evaluar cómo se comportan los agentes de IA en flujos de trabajo empresariales reales.

AI Eye: IronClaw compite con OpenClaw, Olas lanza bots para Polymarket

Cointelegraph se compromete a un periodismo independiente y transparente. Este artículo informativo se produce de acuerdo con la Política Editorial de Cointelegraph y tiene como objetivo proporcionar información precisa y oportuna. Se anima a los lectores a verificar la información de forma independiente. Consulte nuestra Política Editorial aquí.

Fuente: cointelegraph.com