Resumen
- AdGazer es un modelo que predice la atención de los humanos hacia los anuncios utilizando IA entrenada en seguimiento ocular.
- El contexto de la página influye en hasta un tercio de los resultados de atención hacia los anuncios.
- Una demostración académica podría evolucionar rápidamente hacia la implementación real en tecnología publicitaria.
Entre el artículo que estás leyendo y el anuncio que lo acompaña, se está librando una silenciosa batalla por tu atención. La mayoría de los anuncios en display no logran captar el interés del público, ya que muchos los consideran una carga invasiva. Empresas tecnológicas importantes, como Perplexity y Anthropic, buscan modelos de monetización más eficaces.
Sin embargo, una nueva herramienta de IA desarrollada por investigadores de la Universidad de Maryland y la Universidad de Tilburg busca cambiar esta dinámica, al predecir con asombrosa precisión si realmente mirarás un anuncio antes de que este sea colocado.
El modelo se llama AdGazer, y funciona analizando tanto el anuncio como el contenido de la página que lo rodea, pronosticando cuánto tiempo un espectador típico mirará el anuncio y el logotipo de la marca, basado en datos históricos de investigaciones publicitarias.
El equipo entrenó al sistema con datos de seguimiento ocular de 3,531 anuncios publicitarios digitales. Personas reales usaron equipos de seguimiento ocular, navegaron por páginas y se registraron sus patrones de mirada. AdGazer aprendió de toda esta información.
En pruebas con anuncios que nunca había visto antes, AdGazer logró predecir la atención con una correlación de 0.83, lo que significa que sus pronósticos coincidieron con los patrones de mirada humanos aproximadamente el 83% del tiempo.
A diferencia de otras herramientas que se centran solo en el anuncio, AdGazer analiza toda la página. Un artículo de noticias financieras junto a un anuncio de relojes de lujo tiene un rendimiento diferente al mismo anuncio junto a un marcador de deportes.
El contexto que rodea al anuncio, según un estudio publicado en el Journal of Marketing, representa al menos el 33% de la atención que recibe un anuncio, y aproximadamente el 20% del tiempo que los espectadores observan la marca en particular. Esta es una información crucial para los mercadólogos que durante mucho tiempo asumieron que la creatividad por sí sola era responsable de captar la atención.
El sistema utiliza un modelo de lenguaje multimodal para extraer temas generales tanto del anuncio como del contenido de la página circundante, evaluando la coincidencia semántica de estos temas. Estas incrustaciones temáticas se integran en un modelo XGBoost, que las combina con características visuales más básicas para generar una puntuación final de atención.
Los investigadores también crearon una interfaz, Gazer 1.0, donde puedes subir tu propio anuncio, delimitar áreas alrededor de elementos visuales y de marca, y obtener un tiempo de mirada estimado en segundos, junto con un mapa de calor que muestra qué partes de la imagen atraerán más atención. Funciona sin necesidad de hardware especializado, aunque la coincidencia temática impulsada por LLM aún requiere un entorno GPU no integrado en la demostración pública.
Por ahora, es una herramienta académica. Pero la arquitectura ya está presente. La distancia entre una demostración de investigación y un producto publicitario en producción se mide en meses, no en años.
Boletín Diario
Comienza cada día con las principales noticias del momento, además de reportajes originales, un pódcast, videos y más.
Fuente: decrypt.co