Las divisiones de activos digitales de Pantera Capital y Franklin Templeton se han unido a la primera cohorte de Arena, un nuevo entorno de pruebas desarrollado por el laboratorio de inteligencia artificial de código abierto Sentient, diseñado para evaluar el rendimiento de los agentes de IA en flujos de trabajo empresariales.
En un anuncio realizado el viernes y compartido con Cointelegraph, Sentient presentó Arena como una plataforma de evaluación de estilo de producción, en lugar de una simple prueba de modelo estático. En lugar de calificar a los agentes únicamente en conjuntos de datos fijos, los somete a tareas estandarizadas basadas en las condiciones del entorno empresarial, incluyendo documentos extensos, información incompleta y fuentes contradictorias.
“En esta fase inicial, la participación se refiere a apoyar el programa Arena y la cohorte de desarrolladores”, comentó Oleg Golev, líder de producto en Sentient Labs, a Cointelegraph.
Golev indicó que los socios están ayudando a definir qué significa un “razonamiento listo para producción” en tareas que requieren manejo de documentos, como análisis, cumplimiento y operaciones. Las empresas no han anunciado compromisos de capital relacionados con esta iniciativa.
Relacionado: Jack Dorsey recorta 4,000 empleos en la reestructuración impulsada por IA a Block
Este lanzamiento se produce en un momento en que las empresas están acelerando la implementación de agentes de IA en flujos de trabajo de investigación y operaciones, a pesar de que los marcos de gobernanza aún no avanzan al mismo ritmo.
Según el Informe de Optimización de Procesos 2026 de Celonis, publicado el 4 de febrero, el 85% de los líderes empresariales encuestados aspiran a convertirse en “empresas agentes” en el plazo de tres años, mientras que solo el 19% actualmente utiliza sistemas multiagente.
Evaluación de estilo de producción, no puntuación estática
Golev describió Arena como una plataforma compartida donde los desarrolladores presentan agentes de IA a tareas estandarizadas y comparan los resultados bajo condiciones de prueba consistentes.
La plataforma rastrea categorías de fallo como alucinación, falta de evidencia, citas incorrectas y lagunas en el razonamiento, lo que permite a los desarrolladores diagnosticar problemas recurrentes.
Arena tiene planeado publicar métricas comparativas de rendimiento a través de un ranking público y lanzar informes postmortem que resuman los modos de fallo comunes y las soluciones propuestas.
Los socios de infraestructura, incluyendo OpenRouter y Fireworks, están proporcionando capacidad de inferencia para la cohorte inicial, mientras que otros colaboradores apoyan con herramientas y talleres.
Relacionado: El aumento de bonos de alto rendimiento indica un riesgo creciente en la minería de BTC y la infraestructura de IA
Capa de Gobernanza ante la creciente autonomía de la IA
La iniciativa surge en un momento en que las empresas financieras y de criptomonedas experimentan con otorgar a los sistemas de IA mayor autonomía económica.
El miércoles, MoonPay lanzó una infraestructura que permite a los agentes de IA crear billeteras y realizar transacciones con stablecoins.
El jueves, ejecutivos de Stripe advirtieron que las blockchain podrían necesitar mejoras significativas de escalabilidad si el comercio impulsado por IA continúa su expansión.
Revista: La IA no te hará rico, pero los juegos de criptomonedas podrían: el fundador de Axie renuncia
Fuente: cointelegraph.com